Addtime:2019-08-03 08:44:00 Hits:773
在考量站內(nèi)搜索排序的時(shí)候,我們更多的認(rèn)為:頁面的相關(guān)性與原創(chuàng)度,在搜索排序中,會賦予較高的權(quán)重,顧才提出這個(gè)話題,供大家一起討論與研究。
比如:
它可能基于頁面分析,在分詞后,借助TF-IDF等算法,判斷頁面的核心關(guān)鍵詞,并且計(jì)算其相關(guān)關(guān)鍵詞的匹配程度,與原創(chuàng)性,在站內(nèi)搜索結(jié)果中,給予理想的排名。
它可能結(jié)合前者基于用戶行為指標(biāo),在站內(nèi)搜索結(jié)果中輸出合理的排序。
但在實(shí)際少量樣本的測試中,我們得出初期如下小結(jié):
相關(guān)性
在搜索結(jié)果展現(xiàn)中,我們利用中文分詞,拆分大量文檔,并賦予每一個(gè)關(guān)鍵詞一定的權(quán)重,但是實(shí)際操作中,我并沒有發(fā)現(xiàn),它對站內(nèi)搜索結(jié)果具有明顯且直觀的影響。
原創(chuàng)度
所謂的原創(chuàng)度,我們這里認(rèn)為,它是一個(gè)相對概念,并且在特定情況下,會計(jì)算去重,當(dāng)然,有一種特殊情況,除外:
站外合作媒體,所展現(xiàn)的內(nèi)容,并沒有在搜索結(jié)果中進(jìn)行去重,比如:某百科與某問答的內(nèi)容。
同時(shí):
① 站內(nèi)文章原創(chuàng)度,有一個(gè)相對的時(shí)間節(jié)點(diǎn),它同樣會得到合理的推薦與站內(nèi)搜索結(jié)果的展現(xiàn)。
② 站外文章的原創(chuàng)度,對搜索結(jié)果并沒有明顯的作用。
時(shí)效性
時(shí)效性相當(dāng)于頭條搜索結(jié)果而言,是一個(gè)十分重要的指標(biāo),對于站內(nèi)文章,無論你的內(nèi)容質(zhì)量如何,當(dāng)天發(fā)布與搜索詞“相關(guān)”內(nèi)容,都會得到合理的展現(xiàn)。
相對于站外內(nèi)容,時(shí)效性,并沒有一個(gè)明確的衡量指標(biāo),其主要的原因我們猜想是頭條蜘蛛抓取與收錄的時(shí)間節(jié)點(diǎn)問題。
權(quán)威度
① 站內(nèi)文章
一般來講,在搜索結(jié)果排序中,時(shí)效性>權(quán)威度>用戶行為指標(biāo),對目標(biāo)搜索結(jié)果的影響相對較大,值得一提的是,其中,權(quán)威度相對較高的賬號,搜索結(jié)果中排序周期穩(wěn)定性相對較高。
而權(quán)威度相對一般的賬號,時(shí)效性排序,持續(xù)的周期較弱。
② 站外文章
從目前來看,站外賬號的權(quán)威度對站內(nèi)搜索結(jié)果的影響,主要包括如下兩個(gè)方面:
1)首頁、欄目頁、TAG頁
從目前來看,對于站外搜索結(jié)果,頭條目前更多在參考PR值的排序規(guī)則,也就是基于鏈接計(jì)算的權(quán)威,你的頁面權(quán)重越高,在頭條搜索結(jié)果中的排序越高。
當(dāng)然,你會看到在百度搜索結(jié)果排名相對較高的頁面,在頭條搜索結(jié)果中,同樣重要,顧我們猜測,它更多的是基于鏈接計(jì)算。
當(dāng)然,深度分析,你可以針對每一個(gè)頁面計(jì)算頁面“權(quán)威度”,這里由于外鏈工具API更新的問題,你可能需要參考多個(gè)工具的數(shù)據(jù)指標(biāo),然后取相對平均值。
2)內(nèi)容資訊頁
而相當(dāng)于站外的內(nèi)容資訊頁面,在頭條的搜索結(jié)果中的排序,我們認(rèn)為頁面標(biāo)題中關(guān)鍵詞具有重要的作用。
頁面標(biāo)題
頁面標(biāo)題中包含關(guān)鍵詞無論對于站內(nèi)與站外,都是一個(gè)非常重要的參考指標(biāo),我們認(rèn)為,它主要包括如下幾個(gè)影響因子:
1)關(guān)鍵詞拆分后,頁面標(biāo)題關(guān)鍵詞包含的先后順序。
2)頁面標(biāo)題中,關(guān)鍵詞的相間距離。
3)描述內(nèi)容中,覆蓋關(guān)鍵詞的個(gè)數(shù)。
其中,值得提醒的是:
1)站外的搜索結(jié)果中,標(biāo)題是核心,并沒有過多計(jì)算內(nèi)容質(zhì)量。
2)短標(biāo)題貌似搜索排序,相對靠前。
站內(nèi)與站外
當(dāng)站內(nèi)與站外內(nèi)容,同時(shí)出現(xiàn)在搜索結(jié)果中,相對于站外內(nèi)容之間的排名比對,更多的是參考頁面權(quán)重。
而相對于站內(nèi)之間內(nèi)容的比對,則更傾向于時(shí)效性>權(quán)威度。
而基于《站內(nèi)與站外》文章比對的時(shí)候,排除標(biāo)題的影響,它則重點(diǎn)考量如下幾個(gè)指標(biāo):
① 內(nèi)容質(zhì)量度(粗略統(tǒng)計(jì)為頁面字?jǐn)?shù))
② 權(quán)威度(站內(nèi)優(yōu)先站外)
③ 時(shí)效性(站內(nèi)時(shí)效性,長周期內(nèi)會計(jì)算用戶行為指標(biāo),包括:評論、點(diǎn)擊率、個(gè)性偏好)
④ 社會熱點(diǎn)(高考成績查詢)
付費(fèi)推廣與戰(zhàn)略合作
目前來講,頭條開放DSP形式的站內(nèi)付費(fèi)推廣,同時(shí),頭條也與一些資源機(jī)構(gòu),建立戰(zhàn)略合作伙伴,比如:某百科,進(jìn)行商業(yè)性的合作,相關(guān),搜索排序,都是具有特定的隨機(jī)性。
總結(jié):上述內(nèi)容,只是利用非工作時(shí)間,粗略的統(tǒng)計(jì)結(jié)果,僅供大家參考與討論。